11月4日,在2021腾讯数字生态大会的云智能专场中,腾讯智能产品副总裁、腾讯教育副总裁李学朝通过题为《沟通有温度,服务新高度》的主题演讲,正式发布了腾讯云小微基于新一代多模态人机交互技术的全新数智人产品矩阵,并对外分享了数智人产品的技术优势、业务场景和应用案例。
(腾讯智能产品副总裁、腾讯教育副总裁李学朝)
“AI助手不仅要提供更加智能的交互体验,还需要通过自学习和自适应等来提升对于行业、应用和用户的理解能力、应变能力和表达能力。”李学朝表示,为赋予AI助手交互智能的能力,腾讯云小微整合了语音交互、自然语言理解、图像识别等AI能力,融合AI Lab前沿AI技术以及搜狗数字人团队丰富的业务模式,打造了基于新一代多模态人机交互技术的全新数智人产品矩阵,实现了从“数字人”到“数智人”的智能化升级。
谈及数智人的技术优势时,李学朝介绍道,在NLP、知识图谱、视觉等全栈AI底层能力的加持下,数智人拥有强大的形象表现力、识别力和感知理解能力,能在不同行业的多种业务场景下做到“听得清、听得懂、会表达”;而3D超写实、3D写实、3D半写实、2D真人、2D卡通五种数智人的风格,搭配可定制形象和腾讯海量IP形象授权,能让数智人拥有丰富多样的人物形象,以满足不同场景下的服务需求。
(五款数智人亮相)
“云小微数智人应用服务的两大场景,分别是企业服务和生活服务。”李学朝表示,目前数智人已经为金融、文教传媒、公共服务等行业的体验型业务场景提供解决方案,以坐席客服、审核面签、理财顾问等形象为用户提供智能交互的新体验,帮助企业在提升服务体验的同时实现降本增效的目的。
以金融行业为例,腾讯云小微数智人助力平安普惠打造了首个金融行业数字员工——平安普惠金融AI数字员工,两年间已经为500万个用户提供7x24小时的自然可视化的人机智能交互服务,在提升用户服务体验的同时,将审核成本降低60%。
“我们希望的是,通过数智人,在生活服务中为用户带来更多陪伴、更多信息交互以及更深的情感链接。”李学朝表示,未来,腾讯云小微数智人希望能够突破时间和空间的限制,打破虚拟和现实的边界,在数字化进程中为各行各业提供有温度的智能交互服务,助力各行各业的智慧化转型。
以下为演讲实录:
尊敬的各位嘉宾、媒体朋友和线上的观众朋友们:
大家好,我是腾讯李学朝,很高兴能在腾讯一年一度的数字生态大会中与大家进行交流。
今天主要跟大家分享的是,腾讯云小微数智人的全新产品,并且从技术到服务,从内到外,从现在到未来,讲一讲我们“开启有温度的数智未来“的愿景是怎样展开的。
随着人工智能、大数据、物联网等技术高速发展,各行业数字化进程加快,不同业务场景对线上用户服务都提出了更高的要求,AI助手除了要提供更加智能的交互体验,还需要通过自学习自适应等来提升对于行业、应用和用户的理解能力、应变能力和表达能力。人机交互模式从文本客服升级为语音客服再到多模态人机交互系统,也就是大家常说的数字人,沟通效率和服务温度都得到了大幅提升。
而腾讯云小微通过整合语音交互、自然语言理解、图像识别等AI能力,同时连接腾讯丰富的内容和服务生态,面向使用场景打磨平台能力,助力行业客户打造有智能、有形象、可交互的数字分身,实现了从“数字人”到“数智人”的智能化升级,也就是腾讯云小微与AI Lab联合开发的新一代多模态人机交互系统——数智人。
最近搜狗正式并入腾讯,也为数智人能力提供了助力。数智人产品深度联动了云小微、AI Lab、搜狗,汇聚云小微综合AI能力,融合AI Lab前沿AI技术,以及搜狗数字人团队丰富的业务模式、作为多模态能力的服务载体,便捷地服务于机构、企业,持续赋能行业。
这些能力从内而外赋予了产品极大的优势。
首先,通过AI技术的加持,数智人产品目前已拥有强大的形象表现力、识别力和理解能力,并且能够保证最优服务性能,在很多场景中都能做到“听得清、听得懂、会表达”。
听得清就是能够把人的声音精准转化成文本。腾讯云小微在语音识别方面深耕建模、降噪、口音与领域适应等技术能力,让数智人能够适应各种复杂的噪声环境。同时,可识别超过34种语种、方言,拥有超过46万的垂直场景热词库。
听清后还需要听得懂。腾讯云小微数智人结合知识图谱能力和垂直领域库,并充分运用全双工的能力,通过语音(ASR)+语义(NLP)双向判断,降低错误响应概率,可进行超过11个语种的机器翻译;同时,通过流式语义+语义VAD,在商用环境中,服务端推流渲染方案文本驱动首帧延迟已降低至600ms内,单台服务器并发上限,半年内提升了60%,在保障交互体验的同时,大幅提升了接待的效率。
在表达交流能力上,腾讯云小微数智人由个性化沉浸式TTS、有风格的语音合成技术、以及具备形象、情绪和动作的虚拟人合成,拥有超过28种语音合成音色,超过30个拟人化形象,在技术内测中实现了根据语义匹配肢体动作,把对话内容多模态多层次地表达出来。
此外,为了让数智人有个性、有情感、更真实生动,我们提供了3D超写实、3D写实、3D半写实、2D真人、2D卡通等5类数智人形象风格,拥有超细微面部情感表情以及数百种肢体动作,可以满足各类场景需求。同时,拥有腾讯的海量IP形象授权,让数智人的形象选择更加丰富多样。
每一位数智人都拥有着不同的形象和性格,可从事不同的职业,并且,每一位都身怀绝技,与众不同。这两天,他们也参与到了数字生态大会多个专场的主持工作中,为所有与会观众带来了他们的“职业首秀”。
云小微数智人一直在通过不断的自学习、自适应,以求为用户提供更主动、更专业的服务。目前,他们已经以不同的形象出现在金融、传媒、文旅、出行等多个行业中,践行着我们服务于人的理念。接下来让我们看看,云小微数智人的落地应用情况。
云小微数智人应用服务的两大场景,分别是企业服务和生活服务。
在企业服务方面,以往一直是以企业和服务提供者为中心,现在我们转变为以消费者和使用者为中心,通过人机交互与协创,提升服务体验的同时实现降本增效。在生活服务方面,数智人以用户体验提升为中心,通过实现“软硬结合”,给用户提供智能交互的新体验。
在企业服务场景中,数智人已优先面向金融、文教传媒、公共服务等行业的体验型业务场景提供解决方案,可担任坐席客服、审核面签、理财顾问、资讯播报、会展主持、导游导览等多种角色。
接下来大家可以通过几个案例进行更深入的了解:
在金融领域,我们助力平安普惠落地了首个金融行业数字员工——平安普惠金融AI数字员工,针对企业面临的人工成本攀升、人力缺乏、员工工作时间无法保障全时段服务等痛点,通过自然可视化的人机智能交互,打造金融数智人分身。目前已累计服务用户500万,审核成本降低60%,保障了2年间7x24h的在线服务,极大提升了用户服务体验。
在疫情期间,观众无法亲临展厅和现场,近距离参与各项活动,给很多展会活动的举办带来了困难。我们为中国(深圳)国际文化产业博览交易会打造了线上虚拟讲解员,拥有讲解服务能力、多种情绪表达能力,能够对展厅、展馆的相关问题对答如流,并配合场景作出生动的情绪动作反馈,让用户在疫情期间,突破空间限制,享受互动性极强的在线讲解游览体验。
在新闻播报领域,我们与新华社合作推出了全球首个AI合成主播。依托少量音视频数据即可快速、低成本生成主播形象,输入文本即可AI合成播报实时音视频流,主播的表情、唇动自然且专业,基本与真人无异。到目前为止AI合成主播已经累计播报新闻超过1万条,保证播报零误差,可实现对日常和突发事件的实时响应。
可以说,数智人具备降本、增效、提升服务体验、增强服务灵活性等优势,比如数字坐席不但可提供7*24小时全时段、大体量服务,成本也仅为真人坐席的1/5,可真正做到多维度提升企业服务能力。随着数智人技术的不断迭代升级,我们相信科技创新的力量也将为企业服务创造更大的价值和可能。
在生活服务场景,腾讯云小微数智人也有着很大的应用空间。数智人以交互智能增强人机互动,在智能车载、智能交通、智能家居、智能硬件等智能服务场景,为用户提供更便捷、智能的服务。
我们的核心思路是:让数智人与智能设备结合,打造以用户为中心的生活服务。
一方面,数智人可以助力提升公众服务效率。比如,数智人可及时、高效地处理用户在公共交通场景中的票务等问题,可代替人力进行政策问答,提升政策办事问答效率。同时,凭借语音交互能力优势,加强对中老年人等群体的服务关怀。
另一方面,数智人可凭借全新的视觉表达,为用户提供自然、丰富的智能交互服务。比如在智能家居中,用户通过语音指令即可随时随地与数智人交流;个性化的形象表现和动作表达能力,也能打造出更优的虚拟偶像服务。未来,数智人技术将重点向融合文字、听觉、视觉、触觉、肢体动作等多维度感知的多模态交互方式演进。
我们希望的是,通过数智人,在生活服务中为用户带来更多陪伴、更多信息交互以及更深的情感链接。首先,全天陪伴可随时呼唤,提升交互效率;其次,有问题直接问,让中老年人也可简单方便地使用,打破数字化中的科技鸿沟,高度还原人与人之间的交流,打造有温度的交流体验,拉近个人与技术的距离。
同时,数智人支持个性化自定义设置,让企业和用户都可打造属于自己独一无二的数智人。
前面说的都是我们的过去,我们过往的成就,接下来让我们说一说未来。未来,我们的数智人会向什么方向发展,又将为社会创造哪些价值呢?
正如我今天分享的主题“沟通有温度,服务新高度”,未来,腾讯云小微数智人希望能够突破时间和空间的限制,打破虚拟和现实的边界,在数字化进程中,为各行各业提供有温度的智能交互服务。
我们将不断提升平台能力,输出更优质的AI应用解决方案,与更多行业实现场景共建,以定制化的服务,助力各行各业的智慧化转型。同时,在不断进行科技创新、产品创新、模式创新的过程中,更好地服务社会,服务于人,为社会创造更大的价值,从而全面开启全新的有温度的数智未来!谢谢大家!